Autor:
Henry Narits

Liisa Rätsep õpetab tehisaru eesti keeles ilmekalt rääkima

Forte ja Eesti ülikoolide rubriigi „Tunne teadlast“ seekordses loos tutvustame Tartu Ülikooli rakendusliku keeletehnoloogia juhti ja tänavust Vabariigi Presidendi noore IT- teadlase preemia laureaati Liisa Rätsepat, kes hoolitseb selle eest, et tehisaru oskaks väiksemaidki soome-ugri keeli rääkida.


Nimi: Liisa Rätsep
Amet: rakendusliku keeletehnoloogia juht (ja doktorant)
Peamised tegevussuunad: keele- ja kõnetehnoloogia
ETIS-e profiil


Milline on praegu käsil olev uurimisteema ja miks on sellega tegelemine oluline?

Laiemas mõttes tegelen keele- ja kõnetehnoloogiaga ehk selle informaatika ja tehisintellekti haruga, mis tegeleb inimkeele ja selle automaatse töötlemisega. Minu tööl on kaks fookust. Esiteks vastutan ülikoolis keeletehnoloogia rakendatavuse eest. Teen selleks koostööd teiste teadlastega ja keeletehnoloogia potentsiaalsete kasutajatega: algatan koostööprojekte, aitan teadustöö põhjal praktilisi lahendusi luua ning suurendada inimeste teadlikkust keele- ja kõnetehnoloogia võimalustest.

Teiseks uurin kõnesünteesi, mis on ka minu enda teadustöö teema. Uurin oma doktoritöös, kuidas arvuteid tehisnärvivõrkude abil inimhäälega rääkima panna nii, et see kõlaks loomulikult, ilmekalt ja väljendusrikkalt. Keskendun peamiselt eesti keelele, kuid ka selle murretele ja teistele soome-ugri keeltele, mis jäävad sageli suurematest keeletehnoloogia arendusprojektidest välja, sest nende kohta on väga vähe andmeid kogutud. Sellise tehnoloogia arendamine kindlustab, et meil on ka tulevikus võimalik tehisintellektiga suhelda oma emakeeles ja et sünteeskõne peegeldab meie keele mitmekülgsust. Meie töö tulemusena on valminud kõnesünteesi platvorm Neurokõne, mis teeb kvaliteetsed sünteeshääled kõigile kättesaadavaks ja võimaldab neid erinevatesse rakendustesse lisada. Näiteks saab tänu Neurokõnele lasta endale ERR-i uudisteportaalis tekste ette lugeda.

Mis on Teie teadusvaldkonnas seni suurimat ühiskondlikku mõju avaldanud saavutus?

Viimastel aastatel on nii keeletehnoloogide seas kui ka ühiskonnas laiemalt väga palju tähelepanu saanud suured keelemudelid, näiteks ChatGPT. Need on muljetavaldavad just oma mitmekülgsuse ja üldistusvõime tõttu. Tänu sellele oskavad keelemudelid lahendada väga paljusid ülesandeid, millele nende loomisel eraldi tähelepanu ei pööratud. Kuigi suured keelemudelid on populaarne teema ja nende roll kasvab tulevikus tõenäoliselt veelgi, siis praegu ma neid veel kõige mõjukamaks saavutuseks ei peaks. Nende olulisust on veel vara hinnata, kuna see on arenev tehnoloogia, mille kasutamise võimalusi alles uuritakse, ja teatud olukordades on nende kasutuselevõtt veel liiga kallis.

Juba pisut küpsematest tehnoloogiatest tooksin esile masintõlke, mille olemasoluga on ühiskond juba harjunud. Juba aastaid, eriti enne suurte keelemudelite populaarsuse kasvu, tõin just masintõlke näiteks, kui tahtsin kellelegi seletada, millega keeletehnoloogia valdkonnas tegeletakse, sest pea kõigil oli mingigi kogemus masintõlke kasutamisega olemas. Kuigi teatakse, et masintõlge teeb aeg-ajalt vigu, on see minu meelest hindamatu tööriist, et infot eri emakeelega inimestele kättesaadavaks teha.

Image
Tänavu pälvis Liisa Rätsep Vabariigi Presidendi noore IT teadlase preemia. Autor Raigo Pajula

Tänavu pälvis Liisa Rätsep Vabariigi Presidendi noore IT teadlase preemia. Autor: Raigo Pajula

Kuidas jõudsite teaduseni ja mis Teid teaduse juures köidab?

Ma ei tulnud lapsena selle pealegi, et teadlase karjäärist unistada, aga nii kiiresti arenevas valdkonnas töötades sai sellest minu jaoks loomulik valik. Kuna bakalaureuseõppes oli võimalik väga erinevaid pea- ja kõrvalerialasid kombineerida, keskendusin korraga nii filoloogiale kui ka informaatikale. Õpingute ajal avastasin juhuslikult, et on olemas selline valdkond nagu keeletehnoloogia. Mul polnud siis veel aimugi, mida keeletehnoloogia endast kujutab, kuid kuna see sõna ühendas minu senised huvid, otsustasin, et minust saab keeletehnoloog. Peagi kandideerisin praktikale keeletehnoloogia uurimisrühmas, hakkasin osalema uurimisprojektides ja spetsialiseerusin keeletehnoloogiale oma magistriõpingutes.

Sattusin keeletehnoloogia juurde väga põneval ajal. Keeletehnoloogia ei ole küll uus valdkond, sellega on ka Tartu Ülikoolis juba aastakümneid tegeletud, aga masinõppe ja tehisintellekti hüppelise arenguga on see viimase kümnendi jooksul väga palju muutunud. Selline innovatsioon sünnib suures osas teadlaste töö tulemusena.

Kuna väljaspool ülikooli oli Eestis huvi keeletehnoloogia vastu sel ajal veel leige ja võimalusi teistelt ekspertidelt õppida vähem, otsustasin õpingute järel püsivalt ülikooli tööle asuda. Oma töös sain vähendada seda lõhet teadlaste ja ühiskonna vahel, viies keeletehnoloogilisi lahendusi päris kasutajateni. Iga päev teadlastega koos töötades kasvas ka endal soov doktorantuuri astuda ja oma teadustööga kõnesünteesi arengusse panustada.

Kolleegidega suheldes olen mõistnud, et teadustegevus on eri uurimisrühmades väga erinev. Oma teadustöös hindan väga selle rakenduslikku iseloomu. Mulle meeldib, et üritame oma teadustööd kombineerida sellega, mis on meie hinnangul Eesti ühiskonnale kasulik. Lisaks on mul väga palju vabadust ja mänguruumi erinevate ideede katsetamiseks ning suurepärane töökeskkond, kus teiste teadlastega mõtteid vahetada.

Millise teadustöö tulemuse üle olete eriti uhke?

Kuna ma olen alles väga noor teadlane ja oma senises teadustöös uurinud peamiselt kõnesünteesi, siis tunnengi selle üle kõige suuremat uhkust. Olen väga rahul, et oleme saanud kõik oma töö tulemused Neurokõne platvormile koondada. Oleme pälvinud ka palju positiivset tähelepanu, mis kinnitab meie töö olulisust: meid on mitmel viisil tunnustatud ja inimesed sageli kirjutavad meile, et tagasisidet anda või koostööd algatada.

Image
Woman

2021. aastal pälvis Neurokõne töörühm riigi parima digiteenuse tunnustuse. Auhinna andis üle toonane ettevõtlus- ja infotehnoloogiaminister Andres Sutt. Autor: Evelin Sulg

Mida soovite oma teadustöös veel korda saata?

Kuna teadus on pidevas muutumises, polegi minu meelest võimalik väga pikki eesmärke seada. Loodan lihtsalt muutustega kaasas püsida ja usun, et küll siis õiged väljakutsed ka minu teele satuvad. Lähiajal on minu teadustöö eesmärk uurida kõnesünteesi edasi, et see kõlaks veelgi loomulikumalt ja toetaks rohkem erinevaid soome-ugri keeli. Lisaks töötan hetkel selle nimel, et peagi doktoritöö kaitsmiseni jõuda.

Loe ka Forte artiklit. 

Cameras

Vaata järele: küberinnovatsiooni konverents 2024

Tartu Ülikooli inimesed [eel]arvamusfestivalil

Arvamusfestivalil lööb Tartu Ülikoolist kaasa pea 40 inimest

Marili Rõõm kaitseb doktoritööd „Multiple approaches to learners’ success and factors affecting it in computer programming MOOCs“

Marili Rõõm kaitseb 19. septembril doktoritööd „Multiple approaches to learners’ success and factors affecting it in computer programming MOOCs“.